IT之家 03-28 09:12

美团发布开源原生多模态大模型 LongCat-Next，让视觉和语音成为 AI 的母语

📌 一句话：美团开源LongCat-Next多模态大模型，首次让视觉和语音成为AI原生能力而非翻译对象。

当前主流多模态模型多为“拼接式”——视觉和语音信息需先转化为文本再处理，本质仍是语言模型。美团LongCat-Next打破这一范式，让不同模态从一开始就平等共存。

美团这次出手直击行业痛点。当多数厂商还在堆参数、卷跑分时，美团选择了架构创新这条路，更难但更有价值。不过开源只是开始，真正的考验在于社区能不能用起来、能否产生杀手级应用。对开发者而言，多一个选择总是好事；但对美团来说，这更像是一场豪赌——赌对了，可能改写多模态AI的游戏规则。 ---

📡 来源：IT之家

📖 原文链接